某市人口突破1000?别再栽跟头!5招远离7大数据陷阱!
点击下方名片,关注我们↓↓↓
“×市常住人口突破1000人”(应为万人)“2021年度经审计净利润6969.59亿元”(应为万元)“同比增长幅度超过70”(应为70%)……
看到这样的表述是否感觉啼笑皆非?这些“伤害性够大侮辱性又强”的数据差错竟都是出自媒体之手,有些见诸报端,有些在网络平台广泛传播。
新闻报道数据出错,大大伤害了媒体的公信力。如何准确驾驭数据?数据获取、使用过程中的各环节有哪些陷阱?
6月中旬,传媒茶话会对话新华财经副总编辑王涛,澎湃新闻数据新闻部总监张泽红、数据新闻部记者陈良贤,新京报贝壳财经智媒创意报道部主编任娇,大河财立方编创部主编李震。
数据陷阱令媒体频栽跟头
6月初老乡鸡3年近1.6万人未缴社保冲上热搜,老乡鸡董事长出面道歉并澄清了社保缴纳情况,称媒体存在重复计算数据的问题。
像老乡鸡这样因数据有误造成的新闻失实并不是孤例。
今年4月,河南某市发布一季度经济运行情况通报,全市GDP增速居全省第二位。某媒体直接将“GDP居全省第二位”写进了标题,让读者误把增速第二当成总量第二。不久后,该稿件被删除。事实上,稍微熟悉河南区域经济的人都知道,该市GDP长期居于省内第三,跟第二名还有不小的差距。
再如,2021年3月,快手科技上市后发布首份财报,“快手2020年全年净亏损1166亿元”的报道刷了屏。
实际上,在国际财务会计准则中,优先股会被计为负债,产生的公允值变动便被记为亏损。快手财报中股权持有人应占年内亏损1166亿,其中包含了可转换可赎回有限股公允价值变动的1068.45亿。也就是说,快手2020全年的经营亏损是103亿元,经调整后亏损为79.48亿元。
大河财立方编创部主编李震告诉传媒茶话会,新闻报道中数据出错,很大一部分原因是有的编辑记者存在严重的依赖心理,把本应前置的核对工作推到下一环节,把问题留给了终审发稿人。这就容易导致“三审三校”的审核流程形同虚设,极易出现事实性差错,甚至是政治性差错。
“计算错误、信息折叠、夸大细节以掩盖事实、隐藏数据中不确定性、通过建立虚假关系构建错误因果关系等原因,让数据充满了欺骗性。”澎湃新闻数据新闻部总监张泽红透露,在以数据为核心的数据新闻报道中,也存在数据偏差问题。
在新京报贝壳财经智媒创意报道部主编任娇看来,数据可视化可以让财经数据和新闻更加简单、直观,而在数据新闻中错误使用数据的情况可能出现在任何一个流程中。
作为资深财经媒体人,从一线记者做起的新华财经副总编辑王涛对新闻报道中数据的使用有着较深观察。
“造成数据出错的原因较为多样,对数据源不够较真、对权威性的认知不足、对专业知识的缺乏、对数据引用的随意、对专家学者的盲从,都可能导致数据失实。”王涛向传媒茶话会分析道。
常见的数据陷阱有哪些?
新闻报道中为什么会出现数据错误?在数据的获取、辨别、计算、解读等环节中,分别有哪些陷阱?
在王涛看来,常见的数据差错主要有常识性差错、数据源差错、诱导性差错、专业性差错等几大类,具体到每个环节都有陷阱。
1.常识性差错
2.数据源陷阱
“我们对采编的要求是‘无一字无出处’,当然这句话并不仅仅指数据。”在王涛看来,这种溯源的理念是非常必要的。
“在新闻报道中最不可逆的是数据源错误。”张泽红举例说,被采访者可能提供错误的数据,尤其是口头采访的数据可能有误。“此外可能还有数据采样过低,数据覆盖面不够等原因。”
任娇提醒注意数据获取的渠道是不是官方发布、权威发布渠道,数据发布时间相隔太久已经失效等问题。“警惕数据准确性的错误,如果数据并不是真实测量所得出的数据,统计时间和范围存在较大的模糊性。”
“数据的质量有高低,并非所有数据都值得引用。”在王涛看来,数据源是数据质量高低的重要标准。“现在有数据被滥用的倾向,有一些毫无公信力的机构发布的数据,无任何权威性可言,只要足够有噱头,就会有媒体引用。”
3. 数据选择、清洗陷阱
媒体对数据表述维度和统计口径选择的差异也可能造成错误。例如,经济数据年报中经常出现总量、新增的表述差异;数据单位的区别也要小心,是“万”还是“亿万”。
另外,这三种情况也要重点注意,一是把不同层面的数据汇总到一起使用,二是对比率或比例进行过度计算,三是混用比例和百分比。
4. 数据分析陷阱
任娇认为,媒体进行数据新闻报道时,在数据收集、存储、关联、转化、清理的过程中可能由于形式不正确、处理不当,导致数据与类目级别不匹配或混入错误数据。此外,还可能出现度量单位或者日期等字段不一致或不兼容的情况。“不同数据集聚在一起带来的缺失值或重复,也可能改变原有数据分布。”
5. 数据思维惯性陷阱
“先形成假设再寻找数据验证或者推翻假设,往往容易急于相信假设是正确的,而放弃分析或者忽略不符合假设的数据。”任娇提醒,人们主观上更倾向于证实自己最初的预想,如著名的“辛普森悖论”,两组数据分别讨论时,某一组数据对应的主体都占优势,一旦合并就导致相反的结论。
此外,大数据分析处理过程中也容易出现“数据噪点”“数据异项”,某一项数据过小或者过大,都会影响整体的分析结果,这样的结果是否可以代表整体,也需要进一步结合实际来做判断。
6. 数据可视化陷阱
在数据新闻报道中,常见为了追求图表的“炫酷”和美观进行大量的图表堆砌的现象,导致真正重要的数据隐藏其中,大量的装饰性元素淹没了真正重要的信息。
在数据可视化时,警惕图表出现不同坐标轴的低级错误,同时对颜色和元素的使用也要小心。例如财经数据经常使用红色代表股价上升,绿色代表下降,而在美股中绿色是上升,红色是下跌;再如冬奥会logo与冬残奥会logo不同,不能误用。
7.数据诱导性陷阱
王涛提醒说,数据的发布方可能会有自己的利益和诉求,尤其是一些机构可能为了商业目的而臆造数据,乍一看也是所谓“官网数据”,但实际暗含倾向,而提出必要的质疑和核实数据是个苦差事,采编人员往往会被误导。
再如,对一些企业进行采访时,要防范企业以偏概全,向记者介绍最有利于自身的统计口径数据。不少行业协会都会按照月度、季度、半年度、年度等周期来发布统计数据,但不同的统计维度、统计口径得出的企业排名往往有区别,缺乏经验的记者会被企业的选择性引用数据带偏方向,导致报道内容不够客观全面。
“相比文字,图表在传播中更有优势。如果想要达到诱导读者的目的,会通过调节各种参数,得出和数据本身并不相符的结论。”澎湃新闻数据新闻部记者陈良贤分享了一个案例。
下面两张图片分别是凤凰新闻(左)和 BBC (右)报道中国新冠确诊人数的地图,数据更新时间都是2020年2月14日下午。BBC将确诊病例大于500例的省份都赋予最重的深红色,导致当时确诊529例的重庆和确诊51986例的湖北是一样的颜色。而凤凰网是以10的次方为分界线,重庆与湖北就有所区分。所以,除了地图国界线不对,BBC的地图还有诱导读者对疫情真实情况误判的问题。
图片来源:澎湃新闻
5招远离数据陷阱
梳理出常见的数据陷阱和错误原因,如何才能有效避坑?访谈对象给出5点建议。
1.端正态度,敬畏数据
“对数据所反映的新闻事实要抱有敬畏心,不强加联系,不妄断结论,保持思维清晰。”任娇说道,认清数据必然是代表某一时间段和范围,数据并不是现实的绝对反射,数据存在一定有相应的条件。
2. 追溯初始信源,确保来源权威
“数据的准确性、客观性永远是新闻报道第一位的。”李震提醒,核实数据是否来自官方发布渠道;对于经济数据中按季度、按月份发布的数据,核实是否是最近发布的数据;从非权威渠道获取的信息,应当与权威部门核实后再进行报道。
他还提到,对于受访者,要对其身份和立场做个判断。“即便是有一定身份的受访者,也不能盲目迷信,要敢于质疑、善于怀疑。”
张泽红
进一步补充说,有时候可能会出现“明知获取的数据源是一个相对片面的,不够充分的,但又无法补充或回避的”情况,“那就需要在可视化阶段不断提醒读者这个数据具有局限性。在数据公开不够的情况下,这是一个不值得提倡但又反复使用的妥协方法。”3. 严格采编流程,建立交叉审核机制
对于数据新闻报道,常规的审核方式可能难以发现数据陷阱,可以建立交叉审核机制,假定文中的关键数据均是差错,推倒重新计算、分析,再进行比对,这样才能尽可能真正避免差错的出现。
“在澎湃新闻,数据的可及性是评判数据选题报道能不能立项的第一条准则。在拥有数据源时,反复的多次对数据源进行交叉验证是最有效避免数据源错误、数据偏差的手段。”张泽红表示。
4. 提升专业能力,取得相应资质
李震建议相关记者编辑自我充电,通过考取证券、基金、银行、会计等行业从业资格,以考促学,避免在数据的采集、分析、预测、发布等各个环节出现问题。
据了解,大河财立方要求记者编辑考取证券、基金、会计、银行从业等行业资格,鼓励考取证券分析师、期货分析师资格,甚至更高阶的CPA、CFA等证书。
此外,遇到一些行业领域更为专业的数据分析报道时,比如养殖行业、科技公司等领域的会计准则要求不同,可以寻求精于细分领域的投行人士、专业分析师的帮助。
5.巧妙借助工具
善于运用数据分析工具也能如虎添翼。比如Wind、同花顺、Choice数据、天眼查、企业预警通等数据分析软件。
再如,新华财经国家金融信息平台也提供不少实用功能,包括企业股权穿透、一些经济数据模型等。除了数据库本身,该平台还提供大量工具,可以帮助记者进行数据的统计、整理、分析、挖掘等。
本文部分图片由花瓣美素提供
END
往期推荐
本文经「原本」原创认证,作者传媒茶话会,点击“阅读原文”或访问yuanben.io查询【3KMCVSEQ】获取授权